1
พื้นฐานข้อความ: ตัวอักษร (Char) เทียบกับสตริง (String) ในจูลีอา
AI015Lesson 5
00:00

ในจูลีอา ข้อความจะถูกจัดการผ่านองค์ประกอบสถาปัตยกรรมสองแบบที่แยกจากกัน ได้แก่ ตัวอักษร 32 บิต ชนิดพื้นฐาน และสตริงที่ไม่สามารถเปลี่ยนแปลงได้, สตริงที่เข้ารหัสด้วย UTF-8. แตกต่างจากภาษาอื่น ๆ ที่ตัวอักษรถือเป็นสตริงที่มีความยาวเพียงหนึ่งตัวอักษร จูลีอาถือว่า ตัวอักษร เป็นประเภทจำนวนระดับแรก ซึ่งแทนรหัสโค้ดยูนิคอเดอร์ (Unicode code point)

1. โครงสร้างประเภทและหน่วยความจำ

ตัวจริง ตัวอักษร เป็นชนิดพื้นฐานขนาด 32 บิต (ซับไทป์ของ AbstractChar) สตริงที่มีอยู่ในตัว (built-in) สตริง (ซับไทป์ของ AbstractString) รองรับช่วงรหัสยูนิคอเดอร์ทั้งหมด ขณะที่ ตัวอักษร มีขนาดคงที่ ส่วน สตริง มีขนาดแปรผันได้ ตัวอักษรแต่ละตัวใช้พื้นที่ 1 ถึง 4 ไบต์ โดยจุดเปลี่ยนสำหรับอักขระแบบ ASCII เกิดขึ้นที่ $0x80(128)$

2. การคำนวณและการเปรียบเทียบ

เนื่องจาก ตัวอักษร แทนรหัสโค้ดเชิงตัวเลข คุณสามารถทำปฏิบัติการทางคณิตศาสตร์ได้ ใช้ Int('a') เพื่อให้ได้ 97 และ Char(97) เพื่อให้ได้ 'a' การเปรียบเทียบตามลำดับอักขระ (lexicographical comparison) ได้รับการสนับสนุน: 'X' < 'x' เป็นจริงเพราะอักษรตัวใหญ่เรียงมาก่อนอักษรตัวเล็กในมาตรฐานยูนิคอเดอร์

คุณสมบัติตัวอักษร ('a')สตริง ("a")
ประเภทตัวอักษรสตริง
ขนาดคงที่ 32 บิตแปรผันได้ (รหัสแบบ UTF-8)
สามารถเปลี่ยนแปลงได้ไม่เกี่ยวข้อง (ประเภทค่า)ไม่ (ไม่สามารถเปลี่ยนแปลงได้)

การเปรียบเทียบซ้อนกัน เช่น 'A' <= 'X' <= 'Y' จะให้ผลลัพธ์เป็น จริง หรือ เท็จ ตามลำดับของรหัสยูนิคอเดอร์

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>